煉丹寶典 | 整理 Deep Learning 調參 tricks
記錄煉丹優化tricks 最后更新: 2020-04-15 18:17:57 尋找合適的學習率(learning rate) 學習率是一個非常非常重要的超參數,這個 ...
記錄煉丹優化tricks 最后更新: 2020-04-15 18:17:57 尋找合適的學習率(learning rate) 學習率是一個非常非常重要的超參數,這個 ...
本文把對抗訓練用到了預訓練和微調兩個階段,對抗訓練的方法是針對embedding space,通過最大化對抗損失、最小化模型損失的方式進行對抗,在下游任務上取得了一致的效果提升。有趣的是, ...
背景 方法 作者們提出了一種模型驅動的方法,使用自動對抗的方法自動生成未觀察過的對抗樣本,並運用生成的樣本最終提升閱讀理解模型的效果魯棒性,全程無需人工參與。 該方法可以簡 ...